English

我国计算机理解语言研究走出新路

1998-06-12 来源:光明日报 记者 何东平 我有话说

本报北京6月11日讯中国科学院声学研究所研究员黄曾阳,八年迄今创立“概念层次网络”(HNC)理论,在计算机理解自然语言上获新突破。目前,由中科院声学所、中国人民大学对外语言文化学院、北京语言文化大学语言信息处理研究所、中科院软件中心组成的攻关组正在为“概念层次网络”理论产品化和产业化紧张工作。全国人大常委会副委员长、著名语言学家许嘉璐日前考察这一攻关组后说:这是落实科教兴国战略的一件实事。

攻关组成员、中国人民大学对外语言文化学院教授林杏光介绍说,用计算机理解人类的自然语言,这是几十年来未能攻克的世界性重大科学难题。迄今为止,许多语言信息处理系统或产品多是基于统计的,例如,输入计算机时反复出现“完成”与“任务”相连,计算机便能反应出“完成任务”为正确搭配。然而,这并非建立在对语言理解的基础上。15年前,日本花费巨资搞了一个第五代计算机(又称智能计算机)计划,其中一个重要目标就是使计算机能理解人类语言,结果未获成功。美国微软公司1998年计划投入26亿美元,用于开发自然语言理解等软件技术。黄曾阳总结了国外在这方面希图一步到位的教训,提出计算机理解语言的新标准——“消解模糊”。林杏光解释说,语音流具有五重模糊,即发音模糊、音词转换模糊、词的多义模糊、语义块构成的分合模糊、指代冗缺模糊。书面语主要存在后三重模糊。黄曾阳创立了语汇层面联想脉络和语句层面联想脉络,其实质是用语义分析代替传统的句法分析。举例说,将一个句子输入该理论的系统,它能识别谁是句子的核心,并对核心进行语义分类和句类分析,最后达到计算机理解语句的目的。将没有标声调的拼音流输入,计算机能进行智能音字转换。这一高新技术,将使机器翻译、电话翻译、人机对话、智能检索、自动文摘等语言处理的各个领域获得实质性的重大进展,为我国创新语言信息产业带来了曙光。

黄曾阳已发表论文《HNC理论概要》。中国中文信息学会理事长、中国工程院资深院士陈力为教授为之写下评语:“机器翻译搞了几十年,但至今未能达到可供实际应用的水平,其主要原因正是自然语言理解没有获得根本性的突破。任何科学上的突破都需要非常规的思维即扩散性的求异思维。黄曾阳先生创立的面向自然语言理解的理论框架HNC理论,在语义表达上有自己的特色,在语义处理上走了一条新路。鉴于汉语语法研究尚有诸多困惑,因此,HNC理论所走的以语义表达为基础的新路子对突破汉语理解问题尤其有实际意义。”

[值班总编推荐] 以劳动谱写时代华章

[值班总编推荐] 青年的朋友习近平

[值班总编推荐] 把握“新质生产力”概念的理论基础

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

光明网版权所有